用于描述分布,而概率质量函数(PMF)用于离散数据。当综合数据时,可以通过从现有数据的分布中进行采样来生成新的数据点。插值和外推。插值和诱惑涉及在现有数据点之间或之外生成新的数据点。这对于时间序列,地理数据等特别有用。一种常见的插值方法是线性插值,其中新点的值取决于两个已知点之间的线性关系。蒙特卡洛模拟。蒙特卡洛模拟启用随机抽样,以模拟真实系统中的不确定性。在数据综合中,该方法用于通过随机从已知的分布中进行随机采样来生成新样本。它在财务,工程和物理建模中找到了常见的应用。基于模型的采样。此方法涉及利用现有数据的统计模型来预测新的数据点。例如,可以将线性回归模型拟合到存在数据,并且可以通过随机采样模型参数来生成新的数据点。这种方法对于表现线性关系的数据特别有效。内核密度估计。 内核密度估计插入每个数据点周围放置核(通常是高斯内核)并计算每个点的贡献以估计概率密度函数。 这对于捕获数据分布的复杂性和多模式很有用。内核密度估计。内核密度估计插入每个数据点周围放置核(通常是高斯内核)并计算每个点的贡献以估计概率密度函数。这对于捕获数据分布的复杂性和多模式很有用。生成新样本时,可以根据估计的概率密度函数进行随机采样。
主要关键词